3.1.2. Cross validation iterators
Cross-validation iterators for i.i.d. data
KFold
RepeatedKFold
RepeatedKFold repeats K-Fold n times. It can be used when one requires to run KFold n times, producing different splits in each repetition.
「繰り返しの各回で異なる分割をしてKFoldをn回実施する必要があるときに使われうる」
random_state = 12883823と、シードに大きい数値を渡している
LeavePOut
ShuffleSplit
Random permutations cross-validation a.k.a. Shuffle & Split
「ランダム順列交差検証」
ShuffleSplit is thus a good alternative to KFold cross validation that allows a finer control on the number of iterations and the proportion of samples on each side of the train / test split.
「ShuffleSplitは、イテレーションの回数や訓練/テスト分割の各側のサンプルの割合によりきめ細やかな制御を可能にするので、KFold交差検証のよい別の選択肢である」
Cross-validation iterators with stratification based on class labels
StratifiedShuffleSplit
Cross-validation iterators for grouped data
GroupKFold
など
PredefinedSplit (3.1.2.4)
Note that the convenience function train_test_split is a wrapper around ShuffleSplit and thus only allows for stratified splitting (using the class labels) and cannot account for groups. (3.1.2.5)
「train_test_splitはShuffleSplitのラッパーで、クラスラベルを使った層化分割のみ可能。グループは説明できない」
Cross validation of time series data
TimeSeriesSplit